实施容错系统的重要性是什么
容错系统,是当计算机系统内的部件出现允许故障时,仍能正确执行所规定任务的一种计算机系统,实施该系统的重要性是能够支持系统的备份和避免系统故障以维持系统的运行,使得计算机既能容忍故意逻辑故障又能容忍随机物理故障。系统容错这个特性允许你为一个系统提供硬件冗余。容错是更一般的术语。Novell公司用SFT来描述NetWare中的容错特征。SFT允许你安装两个硬盘,并且在辅硬盘上的内容是主硬盘内容的镜像。
如果主硬盘发生故障,辅硬盘就接替它的工作。磁盘控制器也可以双份,或双工工作以进一步防止硬件发生故障。SFT Level Ⅲ(可选)通过双工整个服务器而进一步提供了冗余性。假如主服务器停机时,辅服务器同步无间断地接替它的工作。
SFT Ⅲ可防止以下机器失效带来的损失:随机存储器(RAM)的失效、磁盘的失效、局域网适配器的失效。它允许将服务器放置到不同的地方,以防止局部性的灾难事件或电源故障,但在复置系统需要使用高速链路来保持紧密同步。另外,由于服务器是镜像的,所以当一台服务器继续工作时,可在另一台上进行例程服务和升级。当升级后的服务器又接连回后,它的文件系统需要和另一台服务器进行同步处理。
系统能自动切换资源,采取补救措施,以保证系统继续正确执行任务。这种切换可以是切换到处于待用状态的设备,也可以是把大部分负载转给非饱和状况运行的设备,还可以是在计算机系统不停止运行 情况下,切换电源、冷却系统或其它部件。设计这种计算机采用了容错技术,如采用了纠错码、系统恢复技术、冗余技术、指令复执、程序复算、备件切换、系统降级重新组合、配置检查程序和诊断程序等。但当系统 出现了容错措施许可范围以外的故障时,计算机仍然不能继续正确运行。容错计算机多用于要求高可靠性、 高安全性的场合。如用于飞机自动驾驶的控制系统、航 天飞机操纵系统、卫星的星载系统等。